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AUTOMATISCHER TUNER AUF DER BASIS EINES NICHTLINEAREN 

APPROXIMATORS • , 

ALLGEMEINER STAND DER TECHNIK 
Die vorliegende Erfindung betrifft Tuner fvir 
5 Regler und insbesondere automatische Tuner fur Regler. 
Die Erfindung betrifft ganz besonders Tuner vom Typ des 
nichtiinearen Approximators. Hintergrundinformationeri 
f xir die vorliegende Erfindung f inden sich in dem am 
10. Mai 1994 erteilten US-Patent Nr. 5,311,421 von 
10 Masahide Nomura et ail. mit dem Titel "Process Control 
Method and System for Performing Control of a 
Controlled Sys?:em by Use of a Neural Network" 
[ProzeEregelmethode und System zur Durchftihrung einer 
Regelung eines geregelten Systems durch Verwendurig 
15 eiries . neuronalen Netzes] . Es wird auch auf das deutsche 
Patent DE 4433332 verwiesen, das die Verwendung eines 
neuronalen Netzes als- Tuner fur einen Regler 
beschreibt. 

20 KURZE DARSTELLUNG PER ERFINDUNG 

Die Erfindung ist ein Autotuner zum Abstimmen 
eines Reglers, wie in den unabhangigen Anspruchen 1 und 
8 definiert. Der Tuner weist einen Vorprozessor zum 
Umwandeln einer Menge von Eingangssignalen in eine 
25 Menge von normierten Parametem auf. Diese Parameter 
werden in einen nichtiinearen Approximator :eingegeben, 
der offline ohne vorheriges tiberwachtes Lernen unter 
Verwendung von mehreren Regelkreissimulationen 
eingerichtet worden ist. Ein Optimierungsalgorithmus 
minimiert den Wert einer Kostenfunktion, die von den 
Regelkreissimulationen abgeleitet ist und die die Giite 
der Simulationen angibt, um bptimierte Parameter des 
nichtiinearen Approximators zu produzieren. Der' 
nichtlineare Approximator gibt eine Menge von auf der 
3 5 Grundlage des minimierten Werts der Kostenfunktion 
abgeleiteten normierten Abstimmparametern an einen 
Nachprozessor aus, der diese Menge von Parametem in • 
Reglerabstimmparameter skaliert, die zu dem Regler 
gehen. ' Der nichtlineare Approximator kann auf 
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neuronal eij^ Net zen oder anderefi ^ftmetrisierten 

nichtlinearen Strukturen basieren. • Beim Bestiinmeh von 
nichtlinearen . Approximatorparametern geht es im 
wesentlichen eigentlich darxim, eiinen Tuner zu entwerf en 
Oder einzurichten. Der Tuner wiederum stimmt den 
Regler, der einen Regeikreis aufweist, rtiit 
entsprechenden Reglerparametern ab.. 

KURZE BESCHREIBUNG DER ZEIGHNUNGEN ' 

Figur 1 zeigt einen grundlegenden Regler und 
eine ProzeSbeziehung . 

Figur 2. zeigt einen Regler mit einem Tuner 
zusanmen mit einem Prozefi. 

Figur 3 zeigt einen ProzeS mit einer 
Sprungf unktionseingabe . 

Figur 4 zeigt die Kennlinien einer . Steuerkreis- 
Sprungantwort des Prozesses in Figur 3 . 

Figur 5 zeigt eine graphische Darstellung niit 
einer Sprungf unkti on mit einem resultierenden 
Uberschwingen und einem schwingenderi Ausregeln, die als 
ein System mindestens . zweiter Ordnung.mit VerzSgerung 
modelliert warden muS. 

Figur 5 offenbart die Regelkreis- 

Sprungantwortparameter eines Systems. 

Figur 7 offenbart einen Tuner mit getrennten 
EingSngen fur ProzeSkennlinienparameter und 

SteuerkreisgiiteparameterC "~ 

Figur 8 ist eine graphische Darstellung einer 
schnellen Aiisregelungsgtite mit Uberschwingen. 

Figur 9 ist eine graphische Darstellung einer 
langsamen Ausregelungsgtite ohne Oberschwingen . 

Figuren 10a und 10b zeigen einen automatischen 
Tuner ftir Prozesse, die als lineare Systeme erster 
Ordnung ohne Verzogerung modelliert werden konnen. 

Figur 11 zeigt einen Tuner ftir ein neuronales 
Netz, der in Verbindung mit einem parametrisierten 
Neuroregler verwendet Wird. 



^^^^ 

fPigur 12 veranschaulicht e^Hn Tiiner nach dem 
^tand der Technik fOr ein neurpnales Netz mit einem 
Merkmal eines Algorithmus tiberwachten Lernens. 

Figur 13 ist ein Schemadiagraiiuti eiiies Rahmens 
deir vorliegenden Erfindung, der nicht auf iiberwachtem 
Lernen basiert. 

Figur 14a zeigt ein Beispiel fur einen : Tuner 
ftir einen Proportipnal-Integral-Regler (PI-Regler) , der 
als ein neuronales Netz verkorpert ist, mit Ein- 
Abstimmknopf-Eihgang und -Ausgangen fiir Proportional- 
und Integralverstarkungen. 

Figur 14b zeigt einen Tuner, der als eine 
rechnerisch einfache Verkettungsabbildung mit einer 
Abstimmung verkorpert ist. 

Figur 15 zeigt, wie der Tuner von Figur 14 fvir 
einen bekannten Irnearen Prozefi erster Ordnung 
verwendet werden kann. 

Figur 16 ist eine graphische Darstellung fur 
langsaiaes oder schnelles Ausregeln, je nach der 
Tunereinstellungseingabe . 

Figur 17 ist ein Schemadiagramm zxim Entwickeln 
des Tuners' von Figur 15 unter Verwendung eines 
. nichtlinearen Optimierungsalgorithmus . 

BE.SCHREIBUNG DER AUSFUHRUNG5F0RM 
Figur 1 zeigt einen Proportional-Integral- 
Differential-Regler (PID-Regler) 12 im einfachen 
System, der zum Regeln der Temperatur in einem Raum 
verwendet, werden kann. Der Sollwert ya fur die 
Temperatur wird auf Leitung 13 in den Regler 14 
eingegeben, der auf Leitung 15 eine Ausgabe u . zum: 
Regeln einer Luf tstrSmung, wie beispielsweise Hitze 
Oder HeiSluftstromung, zu ProzeS 16 aufweist. Die 
Reglerausgabe geht zu dem Ofen uber ein Gasventil oder 
eine. andere Of enregeleinrichtung. ProzeS 16 ist der 
Raum, dessen Raumtemperatur geregelt wird. Eine Ausgabe 
y auf Leitung 18 gibt die Temperatur des Raums an. 
Signal y ward zu einem Eingang 20 des Reglers 14 
zuruckgefiihrt. Mit anderen Worten betrachtet sich der 
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Regler 14 ^^Re aktuelle Temperatur auf ^itung 18 und 
die Solltemperatur (Thermos tat temperatur) (y gewiinscht) 
auf Leitung 13, lind berechnet mit der Dif fereriz zwischen 
den Tempera turen die Heizeingabe 15 zu dem Raum bzw. 
dem Prozefi 16. . 

"u" kann relativ zu verschiedehen Bereichen in 
einem einfachen Proportional -Integral -Regler (Pl- 
Regler) gemafi den folgenden Gleichungen gezeigt werden, 
wobei: 

kc die Proportionalverstarkung ^ fur den Regler 



ist 



ki die Integral vers tar kung fur den Regler ist; 
t die Zeit. ist ; 

T eine Integra tionsvariable ist; 

e(t) der ProzeSausgabef ehler zum Zeitpunkt t 



ist . 



u(t) die Reglerausgabe zum Zeitpunkt t ist; 
y(t) die ProzeiSausgabe zum* Zeitpunkt t ist; 
yd(t) die gewunschte ProzeSausgabe bzw. 
Sollwert des Zeitpunkt s t ist; 

U(s) die Laplace -Trans formierte von u(t) ist; 
E(s) die Laplace -Trans formierte von e(t) ist; 
j ein Summations index ist; und 
. 1 ein diskreter Zeitindex ist. 

u{r) = k,e(/) + kj je(TyT (1) 

r=0 . 



wobei, e(t)=ya(t)-y(t) 

U{s) = k.E{s)^!^E{s) ■ (2) 
s 



\ u{l)^ke[l)^k^e{j)M (3) 

Gleichung (1) ist ftir den kontinuierlichen 
Zeitbereich angegeben, Gleichung (2) far den Laplace- 
oder Prequenzbereich und Gleichung (3) fur den 



diskx^Ten Zeitbereich. Die Proportidnalverstarkung (kc) 
. und, Integralverstarkung (ki) sind auf Werte 
eingestellt, die fiir die Anwendung des Regelsys terns 14 
auf den ProzeS 16 arigemessen sind. At . ist das 
Abtastintervall , 

Die zum Einstellen der Reglerverstarkungen, 
beispielsweise kc und ki, verwendeten Algorithmen werden 
als "Abstimmalgorithmen" bezeichnet. Der Abstimm- 
algorithmus wird in einem Tuner 21 von Figur 2 
implementiert. Der Tuner gibt die Verstarkungen k^ und 
ki uber Leitung 22 in den Regler 14 ein. Diese 
. Verstarkungen werden in dem Stand der Technik of tmals 
durch einen Ansatz des^ "Trial and Error" eingestellt. 
Gegenwartige Tuner in der Technik sind nicht 
yollstandig zuf riedenstellend. 

Eingaben in den Tuner 21 mussen zwei Arten von 
Inf ormationen angeben. Die erste Inf ormationsart ist 
die relevante Dynamik. des Prozesses (z.B. Kennlinien 
des Raums, wie . beispielsweise sein W^rmeverlust , 
Aufheizzeitkonstante und die Verzogerung aufgrund 
Rohrleitungen vom Of en zum Raum) . Die zweite 
Inf ormationsart ist die gewunschte Dynamik des 
Regelkreises (z.B. Zeit . bis zum Erreichen des 
Sollwerts, Ausregeizeit , Uberschwingen, Toleranz des 
Uberschwingens und Wichtigkeit des Reduzierens von 
Regelenergie) . 

Figur 3 zeigt eine Sprungf unktion 24 von u zum 
Eingang 15 . des Prozesses 16 und Ausgabe y von Leitung 
18. Figur 4 zeigt die Kennlinien einer Steuerkreis- 
Sprungantwort des Prozesses 16. Der ProzeS ist ein 
ProzeS erster Ordnung mit einem linearen " 
Verzogerungssystem, das ublicherweise ftir die meisten 
industriellen und Gebauderegelprozesse ausreicht . Ein 
derartiges System weist drei ProzeSmodellparameter Kp, 
Tp und Td a:uf , 

Die Verstarkung betragt Kp = (y^ - yo)/(ui - Uo) . 
Die Zeitkonstante Tp = t2 - ti, . (die die Zeit ist, die y 
benotigt, urn 63 Prozent der endgQltigen Ausgabe. zu 
erreichen). Die Totzeit oder Verzogerung betragt 
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Td = ti - Falls Kp, Tp, Td geSnder^^erden , dann 

and^rt sich die Kurve fQr y. 

Figur 5 zeigt sine graphische Darstellung mit 
einer Sprung fvmkti on, die. ein resultierendes 
Oberschwingen und ein schwingendes Ausregeln 25 
aufweist, die als ein System mindeistens zweiter Ordnung 
mit VerzSgerung relativ zu dem Eingang 24 modelliert 
werden mu&. 

Figur 1 zeigt ein Regelkreissystem 12 mit einem 
Sprungfunktionssignal 24 fiir Eingang 13. Figur 6 
off enbart die Regelkreis-Sprungantwortparameter von 
System 12. 

Die ProzeSiiberschwingweite betragt 

Yos = (y2 - yi) /(yi - yo) 

Die Ausregelzeit betragt tsr = ti - to 
Die Anregelzeit betragt t^T = - to 

^.,= Z("(0-"(r-l))' 

Die Regelenergie betragt 

Ein wichtiges Ziel beim Abstimmen eines Reglers 
besteht darin, diese und andere Regelkreis-Antwort- 
parameter zu manipulieren. So ist beispielsweise grofies 
> Oberschwingen in der Regel unerwunscht, aber oftmals 
, unvermeidlich, falls. . schnelle Ausregelzeiten 

erforderlich sind (die Ausregelzeit ist die Zeit nach 
der Sollwertanderung, nach' der die ProzeSausgabe y 
innerhalb einer bestimmten GroSe, . z.B. 95% der 
gewunschten Ausgabe oder des Sollwerts y^ liegt, wobei 
der Prozentsatz relativ zu der GroEe der 
Sollwertanderung berechnet wird) . Bei schnellem 
Ausregeln sind die Regelenergien, was ebenfalls typisch 
ist, hoch. Die Antwortparameter weisen zueinander und 
zu den Abstimmparametern eine komplizierte Beziehung 
auf, und es liegen keine Formeln vor, die diese 
Beziehung prazise . kennzeichnen konnen. 

Verschiedene Abstimmethoden nehmen verschiedene 
Arten von. Tunereingaben der relevanten Dynamik des 
Prozesses und gewunschten Dynamik des Kreises und 
stellen Verstarkungen far verschiedene Arteri von 
Reglern bereit. Die vbrliegende Erfindung des 



Abstiiranens kann fiir jede Art von linearem oder 
nichtlinearem Regler verwendet werden, nicht nur fiir 
eihen PID-Typ. Tunereingaben kSnnen . wie gewiinscht 
zugeschnitten werden, uiid der Tuner kann in jedem 
heliebigen gewOnschten AusmaS robust gemacht werden. 
Die Robustheit ist die gnadige Toleranz gegenuber der 
Unbestimnitheit des Wissens tiber das System. Sie ist 
auch die gnSdige Toleranz gegeniiber: einer Anderung oder 
Drift im System. 

Zwei Arten von Parametern sind "nominal" und 
"geschatzt". So ist beispielsweise JCp die. nominale oder 
tatsachliche Verstarkung und Kp ist die geschatzte 
Verstarkung. Regler sind ausgelegt, die Tatsache zu 
berucksidhtigen, daL& Kp ^ Kp ist. 

Merkmale der vorliegenden Erf indung sind die 
Verwendung von einern oder mehreren nicht linearen 
Approximatoren in dem Tuner und die Verwendung eines 
allgemeinen Optimierungssys terns . Die folgenden Arten 
von nichtlinearen Approximatoren werden eacplizit 
beriicksichtigt : 

• Herkoitmiliche neuronale Multilayer-Perzeptron-Netze 

• Rechnerisch einfache, nichtlineare sigmoidale 
Verkettungsabbildungen 

• Radial-Basisf unktionsnetze 

• Funk t ions verb indungsnetze 

CMAC'Netze (cerebellar model articulation controller 
networks) 

• Fuzzy-Logik-Modelle 

• Wavelet-Netze 

• Polynomausdriicke 

• Spezifische nichtlineare parametrisierte Strukturen 
auf der Basis menschlicher Eingebung uber 
Reg 1 e r abs t immiing 

Diese und andere relevante Approximators truktur en haben 
deh Gesichtspunkt gemeinsam, dag sie . nichtlineare 
Abbildungen implement ier en, deren Form durch 
Manipulieren von mit dem Approximator verknupften 
Parametern nachgestellt werden kann. Somit kann 
allgemein ein nichtlinearer Approximator, wie er in der 
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Erfindung verwendet wiS^ wie folgt 
ausgedrtickt . werden : 

Pc = F(l;pa) 

wobei Pc der Vektor von Reglerabstiinn«>arametern ist, I 
der Eingabevektor zu dem iiichtlinearen Approximator ist 
xmd Pi der Parametervektor fvir den i^proximator ist. 
Beispielsweise kann ein herkSiranliches neuronales 
Multilayer-Perzeptron-Netz die Abbildung F wie folgt 
implement ieren: 



-I 



wobei die hi dazwis.chenliegende Systemgrofien 
{"verborgene Neuronen") sind, berechnet als: 



Hier besteht der Parametervektor pa aus den Inpiit-zu- 

h 

Hidden-Gewichten w , den Hidden-zu-Output-Gewichten 

ki 

w?j und den Hidden- und Output-Bias -Gewichten b^ und 
b? . i und k sind Summationsindizes, j ist das Element 

des Approximatorausgabevektors, h ist die Anzahl 
verborgener Neuronen und n ist die Anzahl- von Elementen 
des Eingabevektors i. Diese Ausdriicke beziehen sich auf 
neuronale Ein-Hidden- Layer " -Netze . Mehr f achschichten 
aus verborgenen Neuronen konnen ebenfalls verwendet 
werden . 

Als weiteres Beispiel kann eine rechnerisch 
einfache nichtlineare sigmoidale Verkettuhgsabbildung F 
wie folgt implementieren : 



i^^er Parametervektor Pa die veKt 
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wobei^^er Parametervektor die vBctoren Wi . und die 
Skalare ai und Vij \imfafit. i ist ein Summations index und 
b ist die Anzahl nichtlinearer Elemente in der 
Struktur . Der ( . ) bezeichnet den Punktproduktoperator . 
Man beachte, dafi diese Form des nichtlinearen 
Approximators, die ansonsten eiiiem neuronal en Netz 
ahnelt, die Verwendung von trans zendent en Funktioneh, 
wie beispielsweise Exponentialfunktionen . oder 
ftyperbeltangensfunktionen, die in ' der Berechnung 
aufwendig sind, nifcht erfordert. Dieser Approximator 
ist der Ansatz erster Wahl fur die vorliegende 
Erfindung. Wiederum konnen mehrfache "Schichten" der 
Nichtlinearitaten verwendet warden. 

Als drittes Beispiel kann ein Radial- 
Basisf unktionsnetz die Abbildung F wie f olgt 
implementieren : 



2 

PcOJ- Y.^,exp(\\I • ) 



wobei der Parametervektor Pa die Vektoren |Ii und die 

Skalare d und wij umf afit . i ist ein Summationsindex und 

N ist die Anzahl GauEscher Nichtlinearitaten in der 
Struktur. 

Als letztes Beispiel kann ein Polynomausdruck 

ais der nichtlineare Approximator verwendet werdenr wie 
z,,B. • ■ 



k=n k=ri=k 
PcD] = Laklk + Z Zbkllkll 
k-1 k=ll=r 



wobei der Parametervektor Pa die Skalare ajc und b^i 
umfai^t und n die Anzahl von Elementen in dem 
Eingabevektor I ist. k und 1 sind Summationsindiz.es. 

Figur .7 offenbart ein Reglersystem 30, das 
einen automatischen Tuner 21, der auf einem 
nichtlinearen Approximator basiert, mit getrennten 
Eingangen fur Prozefikennlinienparameter und Regelkreis- 



Giiteparam^BI aufweist. Mit . • letzteSc kann die 
Regelkreisleistung , ftir langsames oder . schnelles 
Ausregeln nachgestellt warden. Die Eingaben 26 und .27 
gestatten, daS ein im voraus entworfener Tuner 21 fiir 
viele Anwendungen verweridet ward oder ftir groSe und 
zahlreiche Klassen von Anwendungen universell ist. Eiii 
nichtlinearer Approximator 28 wird offline optimiert, 
aber ohne daS Methoden des aberwachten . Lernens 
verwendet werden. Bel dem nichtlinearen Approximator 2 8 
karin es sich urn ein neuronales Netz handeln, er wird 
aber nicht als nichtlineares Regressionsmodell 

verwendet (wie dies in Nomura et al . der Fall .ist 

siehe ihre Fig. 33). 

Zusatzlich zu einem neuronalen Netz oder einem 
anderen nichtlinearen i^proximator 28 enthalt der 
automat ische .Tuner 21 Vorverarbeitungs- und 
Nachverarbeitungsfunktionen. Zu diesen zahlen 

Skalierfunktionen, die auSerhalb des neuronalen Netzes 
erfolgen. Die Skalierung wird hauptsachlich zu 
Linear i tats zwecken durchgef iihrt . Prozefikennlini en- 
parameter 26 (die spater als pp notiert werden) und 
Regelkreis-Guteparameter 27 (die spater als pj notiert 
werden) gestatten, dag ein im voraus entworfener 
automatischer Tuner 21 fur eine breite Vielfalt von 
Anwendungen verwendet wird. Kein Online- oder 
anwendungsspezifisches Training oder eine derartige 
Optimierung des neuronalen Netzes oder ~eine 
Modifikation anderer Komponenten des automatischen . 
tuners werden' ben5tigt. 

Ein spezifisches Beispiel ist der automatische 
Tuner 21, der auf einem neuronalen Netz basiert, ftir 
Prozesse, die als Prozesse erster Ordnung mit linearen 
Totzei.tprozessen modelliert werden konnen. Derartige 
Prozesse kSnnen mit drei ProzeiSmodellparametem (bzw: 
Prozefikennlinienparametern.) 26 modelliert werden: die 
ProzeSverstarkung. die Zeitkonstante und die Totzeit. 
Ein Regelkreis-Gtiteparameter wird ebenfalls angenommen: 
ein Ausregelzeitknopf dsr (dies stellt • den Regelkreis- 
Guteparameter bei 27 in Figur 7 dar) , mit - dem die 
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Regel^feisgate f lir . ein langsames- oder schnelles 
Ausregeln nachgestellt werden kann. Es konnen andere 
Regelkreis-Guteparameter am Eingang 27 vorliegen. In 
diesem Fall kann das neuronale Netz offline ohne die 
Verwendung von uberwachtem Lemen, das im Stand, der 
Technik (wie unten erortert) verwendet wird, unter 
Verwendung eines auf Simulation basierenden 
Opt imierungs systems optimiert werden. 

Figur 8 zeigt die schnelle Ausregelgute (d.h. 
niedriges tsx) mit Uberschwingen fiir einen Eingang 27 
mit niedrigem dsr- Figur 9 zeigt die langsame 
Ausregelgute (d,h, hohes tsT) ohne Uberschwingen fur 
einen Eingang 27 mit hohem dsT- Es kann ein Knopf fur 
dsT vorliegen, der dem automatischen Tuner 21 eine 
analogahnliche Schwahkung liefert, wie beispielsweise 
von Null bis Eins . 

Das Hauptmerkmal der vorliegenden Erfindung ist 
das Design des nichtlinearen Approximators 28. Wahrend 
des Betriebs in einer Anordnung ahnlich Figur 7 kann 
der automat ische Tuner 21 eine grundlegende Architektur 
mit Vorprozessor, riichtlinearem Approximator 28 und 
Nachprozessor, wie in Figur 10a gezeigt, aufweisen. Man 
beachte in Figur 10b/ daS drei ProzelSkennlinienpara- 
meter in den automatischen Tuner 21 eingegeben werden: 
Abschatzungen der ProzeSverstarkung, der Zeitkonstanten 
und der Totzeit < und notiert) . Die Ausgabe 

22 des Tuners 21 besteht aus Reglerparametern " (bei 
einem PID--Regler beispielsweise wiirden diese die 
Proportional-, Integral- und Dif f erentialverstarkungen 
sein) . In Figur 10b ist pf"^ eine interne Systemgroge 
fiir den automatischen Tuner 21, die aus Grundlinien- 
Reglerparametern besteht, die dann durch das neuronale 
Netz Oder einen » nichtlinearen Approximator 28 auf 
kontextsensitive Weise modifiziert werden. Man beachte, 
daS durch intelligentes Strukturieren des Autotuners 21- 
die Anzahl der Eingaben, die fiir den nichtlinearen 
Approximator 28 benotigt Werden, in diesem Fall auf 
Zwei reduziert wird. T^/T^ auf Leitung 46 und dsT auf 
Leitung 29 werden in den nichtlinearen Approximator 28 
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eingegebei^Rine Ausgabe 31, , der eiii^^gelparaiaeter 

ist, wird einem Summenpunkt 32 zugeftihrt. Ein. Bias pc 
wird auf Leitung 33 zu beim Summierer 32 

. hinzuaddiert, der auf Leitung 34 einen Wert Pciiom 
5 ausgibt, der der Vektor von nominal en (unskalierten) 
Regelparaitietern ist und der in den Skaliermechanismus 
35 eingegeben wird. Die Ausgabe 22 der Skalierung 35 
geht zu dem Regler 14. 

Per Tuner 21 kann in einer kegelstruktur mit 
10 sowohl linearen als auch nichtlinearen Komponenten 
verwendet werden. So kann der Tuner 21 beispielsweise 
in Verbindung mit einem parametrisierten Neuroregler 36 
verwendet werden, wie in Figur 11 gezeigt. 

Der auf einem neuronalen Netz basierende 
15 automatische Tuner 21 wird offline unter Verwendung 
eines Designrahmens ' optimiert. Es ist ein 
"evolutionarer Rechen" -Algorithmus entwickelt worden, 
der Aspekte von genetischen Algorithinen integriert. 
Auch kann eine Gradieritensuche aktiviert werden/ wobei 

2 0 Gradienten numerisch berechnet werden. 

Der flexible Charakter des Designrahmens 
gestattet eine Optimierung im Hinblick auf Kriterien, 
die herkommlichere Ansatze selten gestatten. 
Insbesondere brauchen Gutekriterien nicht quadratisch 

25 zu sein, noch nicht einmal dif f erenzierbar ; 
Regelstrukturen konnen willkurlich nichtlinear sein; 
und Robustheit kann explizit berucksichtigt werden7 Der 
gegenwartige Ansatz fiir die Optimierung des auf einem 
neuronalen Netz basierenden automatischen Tuners 21 

30 erfordert kein "vorheriges Lernen" , bei dem Eingabe- 
Ausgabe-Kombinationen zuerst unter Verwendung eines 
Separatoroptimierungsprogramms zusammengestellt werden 
mussen, wobei das neuronale Netz 28 dann unter 
Verwendung von uberwachtem Lernen trainiert wird. her. 

3 5 gegenwartige Ansatz kann somit dem Ansatz von Nomura et 

al. (US-Pateht 5,311,421) g.egenubergestellt werden, in 
dem die Verwendung eines neuronalen Netzes zum 
Abstimmeri ebenfalls offenbart ist, in dem aber die 
Entwicklung des neuronalen Netzes einen Algorithmus 
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uberftlihten Lernens erf ordert , f ti^cien entsprechende 
Lehrdaten gesairanelt werden mussen. . 

Man kann das (iberwachte Lernen yon Nomura et 
al . fur den neuronalen Netztviner 37 von Figur 12 
verwendeh. Far den Tviner 37 k5nnen Eingaben mit x xind 
Ausgaben mit Pc bezeichnet werden. dsT ist Teil voii x. 
Pc sind Regelparameter , P., wird mit der gewOnschten 
Ausgabe Pc* verglichen^ und das Ergebnis des Vergleichs 
beim Vergleicherknoten 38 ist ein Fehler e, der dem 
Lernalgorithmus 39 zugefahrt wird. Der Algorithmus 39 
liefert dahn eine Ausgabe zu dem neuronalen Netz 40, um 
die Gewichtungen fur Ausgabenachstellungen 

nachzustellen. Fiir dieses uberwachte Lernen mufi eine 
groBe Datenbank von Paaren (x, P^*) im voraus 
zusammengestellt werden. P^* mug fur viele 
unterschiedliche Falle im voraus berechnet werden. 
Nomura et al . beinhaltet das Eingeben von Inf ormationen 
mit den darin enthaltenen Kennlinien in ein neuronales 
Netz 40 zum "vorherigen Lernen einer Korrelation" 
zwischen den die Kennlinien enthaltenden Inf ormationen 
und einera Regelparameter und Bestimmen eines 
Regelparameters ftir • einen - Regleir . "Vorheriges Lernen" 
bedeutet das Bestimmen von optimalen Regelparametern 
entsprechend verschiedenen Kennlinien des Modells der 
Kombination Regler-Regelstrecke und nachf olgendes 
Verwenden der optimalen Regelparameter als lernende 
Lehrerdaten. In Nomura et al. wird auch angenommen; dafi 
die Eingabe-Ausgabe-Kombinationen als Lerndaten 
verfiigbar sind (Spalte 11, Zeilen 11-17). Die Werte Cj 
in Gleichung (10) sind ideale Ausgaben, wobei das 
neuronale Netz darauf trainiert wird, sich an diese 
anzupassen, und somit mussen die Werte Cj fiir 
neuronales Nietz training zur Verfiigung stehen. Das 
neuronale Netz wird als ein nichtlineares 
Regressionsmodpll verwendet, und somit wird das 
neuronale Netz unter Verwendung der Eingabe-Ausgabe- 
Trainingsdateii rOckw^rts angepaBt . 

Der gegenwartige Ansatz basiert nicht auf 
derartigem tiberwachtem Lernen. Keine Sammlung von 
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Paareri (x,^^*) wird benotigt, und keine^Krechnung von 

(optimalen) Werten Pc* . ist erf order lich. Das 
gegenwartige neuronal e Netz wird unter. Verwendung von 
Of f line-Opt imierung entwickelt; ohne daS es nStig ware, 
im Sinne von Nomura et al. "im voraus zii lernen" . Es 
werden keine Eingabe-Ausgabe-Traihingsdaten benotigt. 

Es sollte angemerkt werden, daS der Stand der 
Technik von Nomura et al . ' dadurch, daS er auf dem 
Ansatz eines liberwachteh Lernens .basiert, auf bestimmte 
Arten von neuronalen Netztunern beschrankt ist. Die 
vorliegende Erf indung vermeidet das uberwachte Lernen 
vollstandig zugunsten eines auf Simulation basierenden 
Optimierungsansatzes, und ein wichtiger, nebenbei 
auftretender Vorzug dieses Ansatzes besteht darin/ dafi 
der Tuner willkurliche , nichtlineare Approximatoren 
umfassen kann, einschlieSlich die Art neuronaler 
Netzstruktur, die in- dem angefuhrten Stand der Technik 
verwendet wird, aber nicht darauf beschrankt ist. 

Das deutsche Patent DE 443 3332 beschreibt auch 
die Verwendung eines neuronalen Netzes als Tuner far 
einen PID-Regler, Wie bei Nomura et al.' mussen zuerst 
Lerndaten fur das neuronale Netz erzeugt werden > bevor 
das neuronale Netz selbst optimiert werden kann. 

Figur 13 zeigt den Designrahmen 41 der 
vorliegenden Erf indung schematisch. Fur jeden 
Parametervektor p werden Regelkreissimulationeri 
durchgefuhrt und ein Gutekriteriumswert berechnet . Kein 
Lernen von Lehrerdaten ist erf orderlich . Der'Vektor p 
kann Verstarkungen fur eine lineare Regelstruktur 
enthalten, so daS ein fester Regler fvir ein bestimmtes 
Kriterium optimiert werden kann; er kann Parameter fur 
einen auf einem nichtlinearen Approximator basierenden 
Tuner oder einen neuronalen Netzregler (z,B. 
parametrisierter Neuroregler (PNC) 36 . in Tigur 11) 
enthalten; oder er kann Parameter sowohl . f tir den Tuner 
als auch den Regler enthalten, so daS beide Module 
gleichzeitig optimiert werden ' konnen . Die Aufgabe der 
Designaktivitat besteht darin,. Tuner oder Regler zu 
entwickeln, die fur einen breiten Bereich von 
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AnweOTTOigen verwendet werden konne^T Somit miissen far. 
jede Wahl von p zahlreiche Regelkreissimulationen 
durchgefiihrt werden. Bei diesen Simulationen werden 
verschiedene Parameter je nach den Designanf orderungen 
variiert: 

• ProzeSmodellparameter pp, die in ^ das 
Prozefimodell (PM) in der Regelkreissimulation 
eingegeben werden 

• Abschatzungsf ehler zwischen diesen ProzeS- 
model Iparamet em und den ProzeEmodellpara^ 
meterabschatzungen , von denen letztere in 
den Tuner und/oder den Regler eingegeben werden 

• Anfangsbedingungen, insbesondere in dem Fall, 
in dem der Regelkreisregler oder das 
Prozefimodell nichtlinear ist 

• Sollwertprof ile, auch fur nichtlineare Regler. 
Oder nichtlineare Prozefimodelle 

• Parameter pj, die die Kostenf unktion 
beeinflussen - die Verwendung dieser Parameter 
gestattet die Entwicklung einer Regell5sung fur 

-eine Klasse von parametrisierten Kriterien 
Jede Regelkreissimulation fuhrt zur Berechnung 
einer elementaren Kostenf unktion Ji . Die Ergebnisse 
aller fiir einen Vektor p durchgef uhrten Simulationen 
werden zu einer Gesamtkostenfunktion J zusammengesetzt, 
die auf den Optimierungsalgorithraus zurackgef Qhrt wird: 



^^^^i ^ die Anzahl durchgef uhrter 

Regelkreissimulationen ist (in der Regel 1000). 

Die obigen Abs^tze beschreiben den allgemeinen 
Rahmen des Des ignsys terns . Fur dieses Projekt sind 
spezifische Wahlentscheidungen far Optimierungslauf e 
getroffen worden, namlich: 

• Proze&nodelle sind erster Ordnung mit Totzeit. 

Die ProzeSverstarkung Kp ist auf 1,0 normiert, 
die Prozefizeitkonstante Tp auf 10,0. Die 
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P^Rstotzeit Td variiert, -^re daS die 
Einschrankung in der nachsten Aussage- gilt: 
Abschatzungen von Kp, .Tp und Td werden in den 
Regler oder Tuner des neuronalen Netzes 
eingegeben, Diese Abschatzungen sind StOrungen 
der eigentlichen Model Iparameter, wie unten 
erortert. ist auf den Bereich . [0,2T^] 

begrenzt. 

Der Parameterschatzwert fur einen Parameter pi 
ist gleichformig in [(l-r)pi, (l+r)pi] begrenzt, 
wobei r ein Parameter ist. r ist eine Funktion 
des Kriteriumsparameters dsT/ die zwischen 0 und 
1 variieren kann. Diese Funktion ist eine 
lineare Funktion, so daS der kleinste Wert von 
r, der erreicht wird, wenn dsT 0 ist, r^in ist; 
und der gr5Ste Wert, der dsT gleich 1 
entspricht, r^ax ist. Somit regelt dsT die 
Robustheit der Regelung zusatzlich dazu, dafi er 
ein Ausregelzeitknopf ist, wie unten erdrtert. 
Der einzige Kriteriumsparameter , der verwendet 
wird, ist dsT- Das . element are Kriterium lautet: 

Ji^aodsTtgy ^ai(l.dsT)yQ3 + a2( ^Au )s 

Hier ist tg^ die skalierte Ausregelzeit fur die 
Simulation, y^^ ist die skalierte groSte 
anteilige Uberschwingweite relative zu der 
Sollwertanderung und (ZAu^)^ ist die skalierte 
Summe von Regelbewegungen iiber den 
Simulationszeitraum. Naturlich variieren alle 
dsT/ tg^, y^^ und Au mit jeder 

Regelkreissimulation, doch wurde der Klarheit 
halber die Abhangigkeit in dieser Gleichung vom 
Fall . i nicht explizit angegeben. Die fiir die 
meisten Experimente verwendeten Gewichtungs- 
faktoren sind ao: 0,75, ai: 0,2, a2 : 0,05. 
Die Gesamtkostenfunktion J ist einfach die 
Summe der individuellen Werte Ji: 
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J = Di 

i . 

Die skalierte Ausregelzeit t^^ basiert wie folgt 
auf der berechneten Ausregelzeit tsT- Zunachst 
werden die erwarteten groSten und kleinsten 
Werte fut tsT berechnet: 



max _ .max max 
^ST ^p-^^Td 



Td 



mm 



min, 



mm. 



md dann wird 
linear skaliert und begrenzt aufierhalb von: 



und dann wird tg^ innerhalb dieser Grenzen 



'ST 



1.0 
0.0 



falls t, 



ST 



-ST 



falls t.,^ < 

ST — *"ST 



sonst 



Ein ahnlicher Ansatz wird zum Berechnen von yl^ aus 
befolgt. Eine anteilige fiberschwingweite von 0,0 (dJh. 
kein Uberschwingen) wird auf einen y^^ -Wert von 0,0 
abgebildet, und ein anteiliges Uberschwingen von 20 
Prozent Oder mehr (relativ zu der Sollwertanderung) 
wird auf 1,0 abgebildet, wobei die Skalierung 
dazwisch.en wieder linear ist..Far.die quadrierte Summe 
von Regelbewegungen lauten diese Grenzen 1,0 und 3,0. 

Die obigen Angaben haben mit einiger 
Ausfuhrlichkeit spezif iziert, wie der 

Optitnierungsalgorithmus einen Parametervektor 

auswertet. Dieses V.erfahren ist fiir die Designs von 
Tunern far neuronale Netze fiir verschiedene Regler 
befolgt worden. Wie die Parameter ftir zwei Arten von 
Reglern - PI/pid und "lineare Regler hoherer Ordnung" 



• •»••; 

• ••••• 

A . - -IS - • 

(HOLC = ^Rgher order linear contro^Krs) gewahlt 
werden, ist unten gezeigt: 

Designparameter PID/ PI -Tuner HOLC -Timer 

^min ' . " 0 0 ' 

^max 0,25 - 0,5 

^ min 

0,2 0,1. 

J. max 

:^Tp 2.0 . 2,0 

^ min 

2,0 .1,0 

TV 

8,0 6,0 

Somit warden sowohl der PID/ PI -Tuner und der HOLC-Tuner 
so. entworfen, daB sie gestatten, dafi Kompromisse 
zwischen Robustheit und Gate vorgenommen werden-, indem 
einfach ein Knopf (dsr) nachgestellt wird. 

Es f olgt ein UmriE des evolutionaren 
Rechenalgorithmus, der fiir das Design der neuronalen 
Netz tuner verwendet wird (der Parametervektor wird 
anstatt als p als w notiert) : 

1. Erzeuge eine Anfarigsmenge oder Population von 
Vektoren wi, ... , wn und bewerte Kostenfunktionswerte 

Ji=J(Wi) . 

max argmax 
Berechne J,^ = Ji, = j. 

i i 

2. Wahle aus der Population willkurlich einen 
Parametervektor W (gleichf ormige Verteilung) 

3. Wahle zufSllig die Storungss tandardabweichung 
a„ aus zwischen spezif izierten unteren und oberen 
Grenzen CT;;'"und 

4 . Erzeuge einen Stdrungsvektor 5„ - N(0, ) 

5. Erzeuge einen Parametervektor t/' <- w'+. b„ und 
bewerte J{\^') 
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o. Falls J-(V) < J'^ax/ dann 

Ersetze W^nax gegen. W 
Setze W auf u/' 
Berechne erneut Jinax und Vaax 
. Gehe zu Schritt 5 .{Storung von rieuem anwenden} 
7 . Gehe zu Schritt 2 . 

Gemafi der vorliegenden Erfindung kann man einen 
Tuner entwerfen, indem man einen nichtlinearen 
Optimierungsalgorithmus zusammen mit einem Regelkreis- 
Simulationssystem verwendet. Der nichtlineare 

Optimierungsalgorithmus versucht, den Wert der- 
Kostenf unktion J(p) durch entsprechendes Nachstellen 
der Parameter p des nichtlinearen Approximators zu 
minimieren. Figuren 14a und 14b zeigen zwei ahnliche, 
auf dem nichtlinearen Approximator basierende Tuner 21. 
In Figur 14a ist der nichtlineare Approximator als ein 
neuronales Multilayer.-Perzeptron-Netz implementiert . 
Die in diesem Fall zu optimierenden Parameter sind 
wi, Wi4, In Figur 14b ist der nichtlineare 

Approximator als eine rechnerisch einfache 
Verkettungsabbildung iinplementiert - die Figur zeigt 
die mathematische Formulierung der Abbildung. Wegen 
seiner rechnerischen Einfachheit ist dies eine 
bevorzugte Ausf uhrungsf orm. Die in diesem Fall zu 
optimierenden Parameter sind Wi, W2, ... Wb/ ai/a2, 
abr vii, V21, .... Vbi. V12, V22/ '-'f Vb2- Es sei 
angemerkt, daj?^ die Implementierungen von Figuren" 14a 
und 14b sehr ahnliche Merkmale aufweisen und in beiden 
Fallen Kc und Ki als Funktionen von dsr und den 
jeweiligen Parametern ausgeben . Der in Nomura et al . 
beschriebene Algorithmus des uberwachten Lernens kann 
jedoch nicht direkt fur den Approximator von Figur 14b 
verwendet werden. Nachdem die entsprechenden Parameter 
bestimmt sind, um J(p) zu minimieren, kann der Tuner 21 
auf reale Systeme angewendet werden (vorausgesetzt , die 
bei dem Design angenommenen Einschr^nkungen geiten fiir 
das reale System) . 

pie Optimierung beim Tunerdesign kann 
kompliziert und zeitraubend erscheinen. Der Tuner 21 
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wenn er ^einma^l entworf en ^Rrden ist, in 
einer Vielfalt. von unterschiedlichen Anwendungeri. auf 
einfachen Rechenplat.tformen . leicht verwendet werden. 
Figur 15 zeigt, wie der Tuner 21 zur Systemregelung 
verwendet wird. Tuner konnen in verschiedenen 
Ausfuhrungsformen entworfen und verwendet werden, je 
nach dem Charakter der Benutzerregelung der gewunschten 
Regelkreisleistung und den Arten von Systemen und 
Reglern, mit denen der Tuner verwendet wird. 

Bei einem Ausfuhrungsbeispiel eines festen 
linearen Prozesses erster Ordnung mit PI-Regler zum 
Abstimmen der Ausregelzeit kann man beschreiben, wie 
die vorliegende Erfindung . angewendet werden kann, urn 
einen auf einem nichtlinearen Approximator basierenden 
Tuner 21 fur den PI-Regler 14 mit einem "Ausregelzeit"- 
Abstimmknopf 29 ,zu entwerfen, w.enn von den Prozessen, 
fur die der ; Tuner 21 entworfen wird, angenonmien wird,. 
dafi sie durch ' eine lineare Dynamik erster Ordnung, die 
prazise bekannt ist, ausreichend charakterisiert 
werden. Ein System ist in Figur 15 dargestellt. In dein 
Laplace-Bereich wird das ProzeSmodell wi^e folgt 
ausgedruckt : . . 

wobei Kp die Prozefiverstarkung und Tp die Zeitkonstante 
ist, deren Werte bekannt sind (durch Experimente oder 
Prozefiwissen) . Der Tuner . 21 weist einen Abs timmknopf 29 
dsT auf, der uber einen Bereich 0,0 bis 1,0 variiert 
werden kann, um die Prozefiantwort auf eine 
Sollwertanderung schnell oder langsam zu machen. Zum 
schnellen Ausregeln ist man hinsichtlich des 
Uberschwingens der Antwort und hinsichtlich der 
Regelaktion relativ tolerant. Bei langsamem Ausregeln 
jedoch mSchte man, dag das Oberschwingen minimi ert wird 
und die Regelaktion nicht aggress iv ist. Figur 16 zeigt 
eine Kurve 42 von y, wenn dsT niedrig ist, und eine 
Kurve 43, wenn dsT fur eine Sollwertanderung 24 hoch 



^rolgendes ist eine mbglich^^^c 



ist. ^TOlgendes ist eine in6glich^^^p.stenfunktion 44 

(Figur 17) fiir diese Ausftihriingsf orm: 



In diesem Ausdruck bezeichnet E(-) den 
Erwartungsoperator und dsr^ [0/ 1] bezeichnet, das die 
Erwartung uber einen . (gleichformig verteilten) Bereich 
von 0 bis 1 von Werten von dsT genoinmen werden soil. tsT 
stellt die Ausregelzeit der Regelkreissimulation dar, 
Yos das Uberschwingen in der Antwort und Aumax die 
maximal e Regelbewegung, die angetroffen wird. Die 
Funktidnen f st ( - ) / f os ( • ) und. f um ( - ) sind 

Skalierf unktionen, so dafi der Effekt der drei Terme der 
relativen Wichtigkeit jedes dieser Merkmale entspricht. 
Man beachte, daft, da dsT eine Eingabe in den Tuner 21 
ist, der Pl-Verstarkungen ausgibt, die das 
Regelkreisverhal ten (und somit y^sf tst und Au^ax) 
beeinf lussen, der Wert des Ausdrucks (1) eine Funktion 
von Parametern p des nichtlinearen Approximators ist. 

Nachdem ein Tuner 21 so entworfen ist, da£ er 
J (w) in Gleichung (1) minimi ert,, kann er direkt zum 
Regeln des Zielprozesses verwendet werden. Die 
Regelgute kann durch Verwendung des Abstimmknopf s dsT 29 
nachgestellt werden. Wenn dst niedrig liegt (in der-Nahe 
von 0), werden Sollwertanderungen schnell nachgefiihrt. 
Wenn dst hoch ist (in der Nahe von 1) , ist eine schnelle 
Sollwertverf olgung nicht langer wichtig, doch wird das 
Uberschwingen der Ausgabe und die maximale 
Aktorbewegung minimiert. Da das Tunerdesign 21 auf 
einem spezifischen Prozefimodell basiert, Wird die 
Tunerleistung natiirlich groStenteils von der Prazision 
des Mode lis abhangen. In: Fallen, in den en das Model 1 
nicht prazise bekannt ist, konnen Tuner fur eine 
robuste Leistung optimiert werden. 

Gleichung (1) kann in den meisten Fallen, die 
von praktischem Interesse sind, nicht analytisch gelost 
werden. Sie kann jedoch durch Monte-Carlo-Simulationen. 



so prazise^ie erforderlich approximiert werden. Diese 
Simulationsapproximation wird durch einen nichtlinearen 
Optimierungsalgorithmus 45 von Figur 17 gefiihrt. Hohe 
Prazision wird natiirlich auf Kosten der Rechenzeit 
5 erlangt. 

Fur die Ausf uhrungsf brm eines unbestimmten 
linearen Prozessors erster Ordnung mit Verzogerung mit 
PID-Regler und Ausregelzeitabstimmung nimmt man nicht 
langer an, dafi der ProzeS prazise' bekannt ist., Der 

10 Tuner 21 wird stattdessen so entworfen, dafi die 
Leistung liber einen Bereich von ProzeSmodellen hinweg 
optimiert wird. Man erweitert das ProzeiSmodell der 
Ausf uhrungsf arm eines festen linearen Prozesses erster 
Ordnung. mit PI-Regler durch Hinzufugen einer 

15 Verzogerung oder Totzeit: 

Tps+l 



wobei Td die ProzeStotzeit ist. Es wird angenoimnen , da& 
20 die drei ProzeSparaineter innerhalb bekannter Ravutie 
K (fxir Kp), T (fiir Tp) und 0 (fur Td) liegen. AuSerdem 
ist man nun an eineni Tuner ftir einen PID-Regler in 
interaktiver Form interessiert . . Die ReglerUber- 
tragungsfunktion lautet: 
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u(s) = 



T,sJ 



E(s) 



wobei U(s) die (Laplace-transf ormierte) Reglerausgabe 
ist, Ti die iritegrale Zeit ist, die Dif f erentialzeit 
30 ist, a die Geschwindigkeitsamplitude ist (eine bekannte 
Konstante). und E(s) der. (Laplace-transf ormierte) Fehler 
ist. 

In diesem Fall kaiin man die folgende 
Kostenfunktion annehmen; 



J(w) = 

d , e 
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max 



P 



T eT 



P 



Hier ist man, anstatt eine Erwartung zu minimieren, 
daran* interessiert, die Worst-Case-Gute zu minimieren . 
Das Maximiim wird uber Raume far dst/ Kp, Tp und Td 
berechnet. Die mit einem Tuner, der fiir die 
Kostenfunktion (2) optimiert ist, in Verbindung 
stehende Robustheit impliziert einen Verlust an 
nominaler Giite. Falls die Prozefimodellparameter- 
abschatzungen tatsaehlich praziser bekannt waren, als 
hier angenommeh wird, dann kannte eine bessefe Regelung 
erreicht warden. Dies legt nahe, daiS ein Abstimmknopf 
hinzugefugt warden konnte, ' der es dem Benutzer ,des. 
Tuners gestattet, von Fall zu Fall einen KompromiS 
zwischen Robustheit und nominaler Gute ohne 
Neuoptimierung zu treffen. Die Beschreibung der 
nachsten Ausf uhrungsf orm. erortert diesen Gesichtspunkt 
der Erfindung. 

Bei einer Ausf uhrungsf orm eines unbestimmten 
linearen Prozesses erster Ordnung mit Mehrf ach-Lead- 
Lag-^jlegler. zur Ausregelzeit- und Robustheitsabstimmung 
ist der Regler nicht vom PID-Typ, sondern besteht aus 
drei Lead-Lag-Termen: ' . 

T f/.x ^ ap (ai s+] ) (a2$+l ) Ta^is+n , 
(b]s+l)(b2s-f])(b3s-hl) 

Es wird ein zweiter Abstimmknopf r hinzugefugt, der 
auch zwischen 0 und 1 variiert. Die. Parameterraume, 
iiber die der Tuner 21 hinweg arbeitet, sind nun eine 
Funktion vori r: 



r€[0,l] 

Der Einfachheit halber kann man zu dem einfachen 
verzogerungslosen ProzeSmodell zuriickkehreh . 

Fur r=0 wird die Erwartung in diesem Fall Tiber 
kleine Raiime K und T bewertet, und man ist daran 
interessiert/ die Giite auf Kosten der Robustheit zu. 
maximieren. Wenn r erhoht wird, nehmen die . Bereiche 
gemaS vorspezif izierter Funktionen K{r) und T{r) zu. 
Man beachte, dalS der Effekt von r in . dst selbst 
integriert werden kann - die langsameren Ausregel- 
zeiten, die mit hohen dgt-Werten verbunden sind, stimmen 
mit der erhohten Robustheit liberein. Somit konnte die 
Kostenfunktion (3) dadurch vereinfacht werden, daS r 
eliminiert wird und k und T von dst abhangig gemacht 
wird. 

Bei den bisher erorterten Ausf iihrungsf ormen hat 
die Eingabe des Tuners 21 keine Inf ormatibnen uber den 
ProzelS 16 selbst enthalten. Die Tuner konnen in dem 
Ausmag fur verschiedene Prozesse verwendet werden, daS 
sie in die obigen Robustheitsraume K, .T und 0 fallen. 
Es werden die nachsten beiden . Ausf iihrungsf ormen 
beschrieben, bei denen der Tuner auch ProzeEparameter- 
abschatzungen als Eingaben erhalt und er sich deshalb 
generisch auf einen betrachtlich grofieren Raum von 
Prozessen anwenden lafit . . Fur die erste Ausfuhrungsfbrm 
wird das generische Merkmal einfach durch Skalieren von 
Reglerverstarkungen erhalten. 

Bei . einem. ProzeS-generischen Tuner mit einem 
ProzeiSmodell ersfcer Ordnung kann. man die 
Designbedingungen der Ausf uhrungs form eines linearen 
Prozesses erster Ordnung mit einem PI-Regler annehmen 
und den Tuner fur spezifische nominale Werte von Kp und 
Tp entwerfen lassen. Diese Werte sollen K^"" und 
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■ip" sein. Bei einer gegebenen Einstellung von d^t. seien 
die yon dem Tuner ausgegebenen Verstarkungen K^""' lind 
K"°"-. Die gleichen Tunerausgaben konnen fur einen 
anderen Prozel^ (einen, der eine Approximation erster 
prdnung gestattet), mit einer Verstarkiing von K^^"* und 
einer Zeitkonstanten von I^^^ durch Adapt ieren der 
Verstarkungen wie folgt: 



nom nom 
P 



^nom^new 
P 

verwendet werden . 

\ Skalierf ormeln konnen fiir alle Faile abgeleitet 

werden, in denen sowohl der Regler als auch das 
Prozefimodell linear sind. Ahriliche Formeln k5nnen auch 
fur einige Falle abgeleitet werden, in denen der Regler 
nichtlinear und das ProzeEmodell linear ist. Derartige 
Skalier formeln konnen willkiirliche Werte von Kp und Tp 
kompensieren. In Fallen, in denen das Prozefimodell 
zusatzliche Parameter enthalt, mussen die obigen 
nominalen Werte Funktionen von Modellparametern sein. 

Die Ausfiihrungsform des ProzeE-generischen 
Tuners mit einem ProzeEmodell erster Ordnung kann man 
durch Hinzufugen einer Verzogerung (Totzeit) zu dem 
Prozefimodell erweitern. Urn einen Tuner zu entwerfen, 
der fiir alle Prozesse arbeitet, die als lineares System 
erster Ordnung ihit^ Verzogerung modelliert werden 
konnen, vorausgesetzt die Verzogerung ubersteigt nicht 
einen bestimmten konstanten Faktor p der Zeitkonstanten 
Tp, kann man dem Tuner eine Prozefimodelleingabe 
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bereitstellen. Diese Eingabe 



ist 



Die 



Designkostenfunktion (1) kann nun erweitert werden als : 



J(w) = 



(0-ds.)f.(t.)+ d,f„(yJ-Hd„f„(A«_)) (4) 



So wird das Tunerdesign fur feste Werte. von Kp und von 
tp ausgefiihrt, wobei Ta zwischen 6 und pTp variiert. 
Nachdem das Design beendet ist - ein Gewichtungsvektor 
w ist bestimmt, der die Kostenfunktion (4) minimiert - 
kann der resultierende Tuner dann fur jeden PrdzeS 
verwendet. werden, der als ein ProzeS erster Ordnung mit 
Totzeit modelliert . werden kann, wobei die einzige 
auferlegte Bedingung lautet, daE die , Totzeit nicht 
grofier ist als das p-fache der ProzeSzeitkonstanten. 
Far eine derartige Verwendung miissen geschStzte Werte 
der ProzeEverstarkung, der Zeitkonstanten \ind der 
Totzeit in den Tuner eingegeben werden. Mit diesen wird. 
Tr berechnet und auch Skalierungen bewirkt, wie 
diejenigen, die oben definiert sind. Da sich die 
Kostenfunktion (4) nicht mit der Robustheit 
beschaftigt, miissen diese Parameter prSzise bekannt 
sein. 

Bei einem Zustandsrackftihrungsregler mit einera 
nichtlinearen Prozefimodell und EingabestSrungszurack- 
weisungsabstimmung wird angenommen, da£ der Prozefi 
nichtlinear ist, wobei die Model Is truktur bekannt ist: 



f2ac,(rK(,)-^:c,^(/)) 

X,(/) + X3(/) 



Sin 







+ 


0 







(5) 



y(t) = xi(t) 

In diesem Model 1 sind die Xi Zustandssystemgrofien und y 
ist ein Parameter. Fur eine Regelstruktur bedient nian 
sich eines linearen Zustandsruckf iihrungsregelgesetzes : 
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u ( t ) =aiAxi ( t ) +a2Ax2 ( t ) +a3Ax3 ( t ) 

wobei Axi=xf*-Xi, d.h. die Differenz zwischen deiti. 
5 gevrtinsGhten Zustandswert und dem gemessenen ' Wert ist. 
Soitiit besteht in diesem Fall das Abstimmproblem darin, 
entspirechende Werte der Reglerparameter al, a2 und a3 
zu schatzen. Dies geschieht auf der Basis von zwei 
Knopf en: Einer ist eine Giitekriteriumseinstellung d^, 
10 die es deiri Benutzer gestattet, bei Sprungeingabe- 
storungen einen Kompromifi zwischen Regelaktion und 
schneller Storungszuriickweisung zu finden, Der andere 

ist eine Abschatzung y des Modellparameters y. Durch 
Einarbeiten dieses letzteren Parameters kc5nnen der 

15 gleiche Regler und Tuner iiber einen Bereich von 
Prozessen mit einer Struktur hinweg verwendet werden, 
. die- ahhlich Gleichung (5) ist, ohne auf ProzeSmodelle 
mit Y^l^ich einem bestimmten spezifischen nominalen 
Wert begrenzt zu seirl. Die Tatsache, daiS ans telle des 

20 tatsachlichen Werts ein Schatzwert von y verwendet 
wird, legt nahe, daS die Abs timmungen gegenuber Fehlern 
bei der Parameterabschatzung eine beim Entwurf 
eingearbeitete Robustheit aufweisen. Folgendes ist eine 
geeignete Kostenf unktion fur diese Ausf \ihrungsf orm: 



j(w)= ^"^l";'^ 

r eir -S(dl)fr^Si6,)] -''-KM d.f„(z(Au)}) (6) 

x(0)€Xo 



Werte fiir y, fiir die dieser Tuner entworfen ist, 
reichen von 1 bis 5. Der Abschatzungsf ehler fur 
30 Abstimmeingabezwecke betrSgt bis zu ± 5 und ist eine 
Funk t ion von ddr, so daS far eine langsame 
Zuriickweisungszeifc eine grOfeere. Robustheit gefordert 
wird. Die Sprungeingabestorungen d, an deren 
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^ man interessiert ist, . weisen Amplituden 
zwischen -d^^ und auf.. tdr ist die Zeit zur 

Zurtickweisung der Eingabestiirung und .S.(Au) ist die 
summenguadrierte Regelaktion. Die Erwartung mufi 
ebenfalls uber einen Raum Xo von Anf angsbedingungen 
x(0) berechnet warden. 

Far die Ausftihrungsf orm eines Zustandsriickfuh- 
rungsreglers mit einem nicht linear en ProzeSmodell und 
Eingabestorungsabstimmung wie oben kann man auch einen 
nichtlinearen Regler bekannter Struktur verwenden, 
beispielsweise : 

= ai X 1 (t) + a2x2(t) + 33x3(1) + a4x 1 (t)x2(t) + asx, (t) X3(t) + a6X2(t)x3(t) 

Bel dieser Ausf uhrungsf orm gibt der Tuner sechs 
Parameter ai-ag aus . Die Kostenfunktion (6) kann Wieder 
verwendet warden. 

Fur einen PD-Regler mit integrierendeiri linearem 
Frozen, leicht zu berechnenden Antwortmerkmalseingaben 
und Anregelzeitabstimmung kann folgendes implementiert 
werden. 

Das Prozefimodell lautet: 



Der Regler ist: . 

u(t) = Kce(0-.Kdf(^hi(iZ^ 

At 

Tunerausgaben sind Proportionalverstarkung Kc 
und Dif ferentialverstarkung Kd. Die Tunereingabe 
besteht aus einfachen, aus der ProzeSausgabe 
berechneten- Merkmalen nach dem Austritt aus dem Prozefi 
zum Zeitpunkt to mit einem Impuls der Hohe H und Breite 



Die ProzeSaus.gabe wird zu den ?;eitpunkten tn+n? fiir 

4 ^ 

n=0, 1> 10 gemessen. Zehn Merkmale werden einfach 

• ■ W 

. als yito^itj)- y(to) fur n=l, 2, lo berechnet. Bei 

dieser Ausf uhrungsf orm wird weder von Tp. ndch von Kp 
angenommen , dafi sie bekannt sind. Entsprechende Werte 
fiir H und W hangen jedoch tatsachlich von dem ProzelS 
ab, und einige allgemeine Begriffe der Zeitkonstanten 
und der Verstarkung sind erf orderlich. ' 

In alien obigen Ausfiihrungsf ormen ist das 
Schlusselelement des Tuners ein nichtlinearer 
Approximator. Verschiedene nichtlineare Approximator en 
k6nnen in diesem Kontext verwendet werden, 
einschlieSlich neuronale Multilayer-Perzeptron-Netze, 
rechnerisch einfache sigmoidale Verkettungen, Radial- 
Basisfunktionsnetze, Funktionsverkntipfungsnetze, CMAC- 
Netze, Fuzzy-Logik-Modelle, die Fuzzif izierung und/oder 
Defuzzif izierung und/oder Zugehqrigkeitsfunktionen. 
verwenden, Wavelet-Netze, Polynomentwicklungen und 
spezifische nichtlineare parametrisierte Strukturen. 



ansprOche 



1. Auto tuner (21) zum Abstiminen eines Reglers 

(14), der folgendes ximfaSt: 

Ein Vorverarbeitungsmittel mit. einer Eingabe 
und einer Ausgabe zum Umwandeln einer Menge von 
Eingabeparametern am Eingang in eine Menge von 
normierten Parametern am Ausgang, 

ein nichtlineares Approximatormittel (28) mit 
eihem mit dem Ausgang des Vdrverarbeitungsmittels 
verbundenen Eingang zum algorithmischen Operieren an 
der Menge normierter Par^eter, 

wobei das nichtlineare Approximatormittel 
offline ohne vorheriges uberwachtes Lernen eingerichtet 
wird, wobei das Einrichten ein System verwendet- mit 
mehreren Regelkreissimulationen, und einem 

Optimierungsalgorithmus (45), 

wodurch wahrend des Einrichtens ,der 
Optimierungsalgorithmus den. Wert einer Kpstenf unktion 
(44) minimiert, die von den mehreren 

Regelkreissimulationen abgeleitet ist und die die Giite 
der Simula tionen angibt, um optimierte Parameter des 
nichtlinearen Approximatormittels zu erzeugen, 

wobei die Ausgabe des nichtlinearen 
Approximators eine Menge von auf der Grundlage des 
minimierten Werts der ' Kostenf unktion abgeleiteten 
normierten Abstimmimgsparametern ist;. und 

ein Nachverarbeitungsmittel mit einem ersten, 
mit dem Ausgang des nichtlinearen Approximatormittels 
verbundenen ersten Eingang. mit einem mit dem Eingang 
des Vorverarbeitungsmittels verbundenen zweiten Eingang 
und mit einem Ausgang zum Skalieren der Menge 
normierter Abstimmungsparameter in Reglerabstimmungs- 
parameter (22) am Ausgang. 
2. Tuner nach Anspruch 1, wobei: 

die Eingabeparameter entweder von dem einen 
Oder von beiden der zwei Arten von Parametern sind, 
wobei die beiden Arten von Parametern sind: 
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Parameter ..(26)^ die ein ^^^tem ais geregelt 
charakterisieren; und 

Parameter (27) , die ein gewiinschtes Regelkreis- 
.: verbal ten charakterisieren, und 

. das nichtlineare Approximatormittel offline 
ohne aberwachtes Lerrien optimiert wird, und wobei die 
Offline-Optimierung keine Erzeugiing von optimierten 
Abstiramungsparametern zum pptimieren des • nicht linear en 
Approximatormittels erfordert. 

3. Tuner nach Anspruch 2, wobei ' das nichtlineare 
Approximatormittel ein neuronales Netz ist. 

4. Tuner nach Anspruch 2, wobei das nichtlineare 
Approximatormittel ein Fuzzy-Approximator ist. 

5. Tuner nach Anspruch 2, wobei das nichtlineare 
Approximatormittel ein Radial-Basisf unktions- 
approximator ist. 

6. Tuner nach Anspruch 2, wobei das nichtlineare 
Approximatormittel ein Approximator ist, der 
nichttranszendente mathematische Funktionen verwendet. 

7. Tuner nach Anspruch 2, wobei das nichtlineare 
Approximatormittel ein Approximator ist, der 
rechnerisch einfache sigmoidale Verkettungsabbildungen 
verwendet- 

8. Auto tuner (21) zum Abstimmen eines Reglers 
(14)/ der folgendes umfaSt: 

einen nicht linear en Approximator (28), dessen 
Verhalten durch Nachstellen seiner Parameter 
modifiziert wird und der offline ohne uberwachtes 
vo.rheriges Lernen eingerichtet wird, wobei das 
Einrichten ein System verwendet, das einen 
Regelkreissimulator und einen Optimierungsalgorithmus 
(45) verwendet, 

wobei wahrend des Einrichtens der 
Regelkreissimulator Reglerparameter von dem Regler zur 
Verwendung in mehreren Regelkreissimulationen empfangt, 
wobei die Regelkreissimulationen die Berechnung des 
Werts einer Kostenf unktion (44) ermoglichen, die die 
Gxite der Regelkreissimulationen angibt. 
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woOPfch -der Wert der Kostenf unk^Kn durch den 
Optimierungsalgorithmus verarbeitet wird, der 
optimierte nichtlineare Approximatorparameter erzeugt , 
die auf derartige Wei,se optimiert werden, dafi der Wert 
5 der. Kostenf unktion minimiert wird, 

wobei der minimierte Wert der Kostenf unktion 
zum Ableiten ^von entsprechenden Reglerabstimmungspara- 
metern (22) zur Lieferung an den Regler vefwendet wird, 
die 2U einer optimierten Reglergute ftlhren. 
10 9. Tuner nach Anspruch 8, wobei das nichtlineare 

Approximatonnittel ein neuronales Netz ist. 

10. Tuner nach Anspruch 8, wobei das nichtlineare 
Approximatormittel ein Fuzzy-Approximator ist. 

11. Tuner nach Anspruch 8, wobei das nichtlineare 
15 Approximatormittel ein Radial-Basisf unktions- 

approximator ist. ^ 

12. Tuner nach Anspruch 8, wobei das nichtlineare 
Approximatormittel ein Approximator ist, der 
nichttranszendente mathWmatische Funktionen verwendet. 

20 _13. Tuner nach Anspruch 8, wobei das nichtlineare 

Approximatormittel ein Approximator ist, der 
rechnerisch einfache sigmoidale Verkettungsabbildungen 
verwendet . 
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